Wiederverwendbarkeit

Damit wissenschaftliche Arbeiten ihr volles Potential entfalten können, ist es wichtig, dass Daten, Software, Methoden und Erkenntnisse von anderen Wissenschaftlern nachgenutzt und weiterentwickelt werden können. Darum ist Wiederverwendbarkeit eine der wichtigsten Qualitätsmerkmale wissenschaftlicher Daten (Wilkinson et al, 2016).

Voraussetzung dafür ist, diese in möglichst guter Qualität und ausreichender Dokumentation (Metadaten) verfügbar zu machen und klar definierte Nutzungsrechte einzuräumen. Aus folgenden Gründen können wissenschaftliche Daten und Software bereits nach wenigen Monaten oder Jahren unbrauchbar sein:

  • Inkompatibilität: Daten, (experimentelle) Software und wissenschaftliche Berechnungen lassen sich nicht mehr ausführen, wenn die abhängigen Programme, Programmbibliotheken und das Betriebssystem nicht mehr in der ursprünglichen Version, etwaigen Lizenzen und Einstellungen vorliegen oder das ursprüngliche Setup aufwändig oder gar unbekannt ist. Ist aktive Wartung über einen längeren Zeitraum nicht möglich, sind methodische Archivierung und Dokumentation daher besonders wichtig. Darüber hinaus ist die Nutzung von offenen, standardisierten Datenformaten von Vorteil.
  • Datenverlust: Daten und Software können etwa durch Hardware-Defekte (z.B. unlesbare Festplatten, DVD's, USB-Sticks) oder Computerviren unwiederbringlich verloren gehen, wenn diese nicht im Rahmen einer Backup-Strategie gesichert werden.
  • Unauffindbarkeit: Werden digitale Ressourcen nicht zentral archiviert und zugänglich gemacht, stellt dies eine Barriere für die Nachnutzung dar. Auch dies kann zum Datenverlust führen, wenn z.B. Personal abwandert und das Wissen über den Verbleib von Daten verloren geht.
  • Fehlende Dokumentation und Metadaten: Wissenschaftliche Daten können nicht genutzt werden, wenn Informationen darüber, wie diese entstanden (Provenance) und zu interpretieren sind, nicht bekannt sind. Dieses Wissen geht - gleich wie technisches Wissen über Software - nach einiger Zeit verloren. Daher müssen Metadaten und Dokumentationen über Daten und Methoden vorliegen, die von Dritten verstanden können.